hadoop面试题(自己整理版)
1、 hadoop 运行原理
2、 mapreduce 原理
3、 mapreduce 的优化
4、举一个简单的例子说下 mapreduce 是怎么运行的
5、 hadoop 中 combiner 的作用
6、简述 hadoop 的安装
7、请列出 hadoop 的进程名
8、简述 hadoop 的调度器
9、列出你开发 mapreduce 的语言
10、我们开发 job 时是否可以去掉 reduce 阶段
11、 datanode 在什么情况下不会备份
12、 combiner 出现在哪个过程
13、 hdfs 的体系结构
14、 3 个 datanode 中有一个 datanode 出现错误会怎么样
15、描述一下 hadoop 中,有哪些地方用了缓存机制,作用分别是
什么?
16、如何确定 hadoop 集群的健康状况
17、 shuffe 阶段,你怎么理解
18、 mapreduce 的 map 数量和 reduce 数量怎么确定,怎么配置
19、简单说一下 mapreduce 的编程模型
20、 hadoop 的 TextInputFormatter 作用是什么,如何自定义实现
21、 hadoop 和 spark 都是并行计算,他们有什么相同和区别
22、为什么要用 flume 导入 hdfs, hdfs 的架构是怎样的
23、简单说一下 hadoop 和 spark 的 shuffle 过程
24、 hadoop 高并发
25、 map-reduce 程序运行的时候会有什么比较常见的问题